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贝 叶 斯 期 中 分 析 与 经 典 期 中 分 析 在 成 组 序 贯 设计 中 的 比较 
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南方 医科 大 学 ! 人 文 与 管理 学 院 , ?生物 统计 学 系 ,广东 广州 510515 


摘要 :目的 比较 贝 叶 斯 期 中 分 析 与 经 典 方法 的 期 中 分 析 的 差异 。 方 法 以 对 照 组 (Control) 和 试验 组 (Treatment) 的 两 样本 均 数 
比较 为 分 析 目 的 , 即 9=w7 -wec(6 越 大 疗效 越 好 ) ,建立 Bo:0 大 0; 豆 :0> 0 的 优 效 性 假设 检验 (拒绝 丽 , 即 支持 处 理 组 疗效 )。 按 照 成 
组 序 贯 设 计 的 数据 要 求 , 在 每 次 期 中 分 析 时 刻 , 计 算 各 种 先 验 分 布 的 贝 叶 斯 期 中 分 析 工 类 错误 .功效 .平均 样本 量 .平均 阶段 数 
等 指标 。 结 果 在 Pocock 和 O'Brien & Fleming 设 计 中 ,Skeptical 先 验 和 Handicap 先 验 的 I 类 错误 e 均 能 控制 在 0.05 左右 。 当 


O' Brien & Fleming 和 Pocock 方 法 功效 在 80% 时 ,基于 Handicap 先 验 和 Skeptical 先 验 的 贝 叶 斯 功效 相对 来 说 明显 较 低 ,而 基于 


Non-informative 先 验 和 Enthusiastic 先 验 的 贝 叶 斯 功效 则 明显 较 高 。 结 论 Skeptical 先 验 和 Handicap 先 验 的 贝 叶 斯 期 中 分 析 能 
较 好 的 控制 工 类 错误 s, 基 于 Skeptical 先 验 和 Handicap 先 验 的 贝 叶 斯 期 中 分 析 相 对 于 OBrien & Fleming 方 法 均 能 够 明显 增加 


试验 提前 终止 的 可 能 性 ,而 对 于 Pocock 方 法 则 没有 太 大 实际 意义 。 
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利用 是 一 个 普遍 现象 ,而 贝 叶 斯 统计 “是 一 种 能 充分 利 
用 先 验 信息 的 统计 方法 。 在 药物 临床 试验 中 ,期 中 分 析 
通常 能 够 有 效 的 降低 试验 所 需 的 样本 量 并 提前 完成 试 
验 , 从 而 为 药物 的 上 市 节省 大 量 的 时 间 和 资源 。 而 结合 


Abstract: Objective To explore the differences between the Bayesian interim analysis and the classical interim analysis. 
Methods To compare the means of two independent samples between control and treatment, superior hypothesis test was 
established. In line with the data requirements for group sequential design, Type I error of Bayesian interim analysis based on 
various prior distributions, Power, Average Sample Size and Average Stage were estimated in the interim analysis. Results In 
the Pocock and O Brien & Fleming designs, the Type I errors in the Bayesian interim analysis based on the skeptical prior 
distribution and the handicap Prior distribution were controlled at around 0.05. When the powers of these two classical 
designs were both 80%, Bayesian powers of the skeptical Prior distribution and the handicap Prior distribution were markedly 
lower. The powers of the non-informative prior distribution and the enthusiastic prior distribution were distinctly higher than 
80%. Conclusion In the Bayesian interim analysis based on the skeptical Prior distribution and the handicap Prior distribution, 
the Type I errors can be well controlled. Bayesian interim analyses using these two prior distributions, compared with the 
analysis adopting the O Brien & Fleming method, can markedly increase the possibility of ending the clinical trials ahead of 
time. The Bayesian interim analyses based on these two distributions do not have practical value for group sequential design 
of the Pocock method. 

Key words: group sequential design; Bayes; interim analysis; Prior distribution 


在 临床 试验 领域 ,以 往 试验 的 先 验 信息 没有 被 充分 


因此 ,为 了 了 解 贝 叶 斯 期 中 分 析 与 成 组 序 贯 设 
计 吕 的 经 典 期 中 分 析 ” 的 差异 ,揭示 两 种 方法 在 具体 应 
用 上 的 优 劣 势 , 定 量 评估 贝 叶 斯 结果 的 可 靠 性 ,本 文 将 
对 贝 叶 斯 期 中 分 析 与 经 典 期 中 分 析 进 行 比较 ,重点 对 几 
种 常见 的 先 验 分 布 的 影响 进行 评估 ,为 贝 叶 斯 期 中 分 析 


了 先 验 信息 的 贝 叶 斯 期 中 分 析 在 临床 试验 中 相对 于 传 
统 期 中 分 析 是 否 可 行 可 靠 .能 否 进一步 提高 效率 等 相关 
疑问 踢 竺 明确 。 
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在 临床 试验 领域 的 应 用 提供 理论 参考 ,也 为 今后 药物 临 
床 试验 的 期 中 分 析 提 供 新 的 思路 。 


1 方法 与 原理 
1.1 成 组 序 贯 设计 

成 组 序 贯 设计 是 一 种 在 试验 正式 结束 前 ,能 提供 多 
次 期 中 分 析 的 设计 。 成 组 序 贯 方法 是 由 Pocock 于 1977 
年 提出 ,在 此 基础 上 Kittelson 和 Emerson 于 1999 年 提 
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出 了 Unified family 方法 ,其 包括 Pocock、O'Brien- 
Fleming .Power family 等 方法 。 其 中 Power family 方法 
是 由 Wang 和 Tsiatis 于 1987 提出 ,其 通过 参数 Power 
值 的 改变 来 得 到 不 同 的 临界 值 。 从 设计 方案 角度 来 说 ， 
成 组 序 贯 设计 是 将 整个 试验 划分 成 玉 个 连续 的 时 间 段 ， 
每 个 时 间 段 内 每 个 处 理 组 都 有 7 个 受 试 者 加 入 。 当 第 天 
个 阶段 (f=1,2,…,K) 结 束 后 ,把 之 前 各 个 阶段 试验 结果 
累积 起 来 进行 一 次 统计 分 析 。 对 于 拒绝 性 的 成 组 序 贯 
设计 ,如 果 拒 绝 H 则 试验 结束 ,否则 继续 下 一 阶段 试 
验 。 当 其 处 于 最 后 一 个 试验 阶段 时 ,其 结果 不 是 接受 
及 ,就 是 拒绝 于,。 
1.2 贝 叶 斯 统计 

假设 参数 0, 其 概率 分 布 为 x(9), 观 察 值 y,.….,y, 来 
自 概率 密度 函数 为 P( yl0), 则 : 

p(0b)= p(0.y)/ p(y)= p(yl0)z(0)/ | p(ylo)r(0)a0 
设 L(0)xp(yl9), 则 p(Oby)~L(0)x(0) 

由 以 上 过 程 也 可 发 现 , 贝 叶 斯 统计 推断 均 是 基于 后 
验 概率 分 布 p(9ly)。 而 贝 叶 斯 统计 与 经 典 统计 的 主要 区 
别 就 在 于 先 验 信息 的 使 用 。 在 贝 叶 斯 统计 中 , 先 验 一 般 
都 具有 主观 性 ,然而 为 了 减少 主观 性 对 后 验 概率 的 影 
响 , 也 提出 了 一 些 较 " 客 观 "的 先 验 分 布 % ,例如 广义 先 验 
分 布 .无 信息 先 验 分 布 . 共 斩 先 验 分 布 以 及 有 信息 先 验 
分 布 等 。 在 一 些 较 复 杂 的 具体 分 析 中 , 贝 叶 斯 统计 需要 
应 用 MCMC 方法 模拟 产生 基于 后 验 分 布 的 样本 ,并 以 
此 来 估计 特征 统计 量 。 
1.3 贝 叶 斯 期 中 分 析 

贝 叶 斯 期 中 分 析 是 基于 试验 过 程 中 所 得 到 的 后 验 
概率 分 布 ,并 在 此 基础 上 作出 统计 推断 。 在 该 过 程 中 不 
需要 事先 指定 终止 标准 以 及 所 需 样 本 量 ,仅仅 应 用 后 验 
P 值 来 进行 期 中 监测 %。 而 经 典 的 期 中 分 析 是 建立 在 
“Neyman-Pearson” 理 论 上 ,其 重点 是 在 于 控制 1 和 [类 
错误 。 

ICH-GCP 将 期 中 分 析 定 义 为 :在 一 个 临床 试验 正 
式 完成 之 前 的 任何 时 间 内 ,为 了 比较 组 间 的 有 效 性 或 安 
全 性 而 进行 的 分 析 。 依 据 后 验 概 率 P 的 期 中 分 析 , 如 果 
小 于 设 定 的 临界 值 e, 即 p(Holdata) 三 (为 了 与 经 典 统计 
工 类 错误 a 区 分 , 记 为 s) , 则 拒绝 万 。 因 此 , 先 验 分 布 的 
选择 对 于 贝 叶 斯 期 中 分 析 是 至 关 重 要 的 。 为 了 让 试验 
支持 者 或 试验 怀疑 者 能 够 达成 较 一 致 的 结论 , 先 验 分 布 
的 选择 有 如 下 两 个 原则 ":; (1) 如果 是 阳性 结局 
(positive result) 的 试验 ,其 P 值 的 计算 应 基于 Skeptical 
先 验 ;(2) 如 果 是 阴性 结局 (negative result) 的 试验 ,其 P 
值 的 计算 应 基于 Enthusiastic 先 验 。 

在 以 上 两 原则 的 条 件 下 , 仍 以 较 大 的 概率 支持 相应 
的 结局 , 则 可 下 支持 相应 结局 的 结论 。 
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1.4 期 中 分 析 之 间 的 比较 设计 

在 临床 试验 中 ,Pocock 和 O' Brien & Fleming"" 期 
中 分 析 方 法 是 成 组 序 贯 设计 中 比较 常见 的 两 种 方法 。 
在 对 比 研 究 中 ,我们 以 经 典 成 组 序 贯 为 设计 框架 ,按照 
频率 学 派 的 观点 ,在 功效 , 工 类 错误 以 及 实际 所 需 样本 
量 等 方面 ,将 贝 叶 斯 期 中 分 析 与 常见 的 两 种 经 典 期 中 分 
析 方 法 进行 比较 。 由 于 成 组 序 贯 设计 在 实施 前 需 确 定 
一 些 参数 ,如 xc、8 、5 以 及 期 中 分 析 次 数 等 ,我们 事先 
定义 期 中 分 析 次 数 为 万 总 分 析 次 数 为 扎 即 K=+1)。 以 
对 照 组 和 试验 组 的 两 样本 均 数 比较 为 分 析 目 的 , 即 
0=1r -Lc(9 越 大 疗效 越 好 ) ,建立 H0:0 二 0; 到 :0> 0 的 优 
效 性 假设 检验 。 对 于 两 组 的 试验 模拟 数据 ,可 由 样本 量 
公式 计算 出 第 阶段 每 组 所 需 样 本 量 ( 假 设 两 组 样本 量 
相等 )。 我们 以 N (jr,@3)、N(jkc, 吕 于 示 试验 和 对 照 组 
总 体 , 从 中 随机 模拟 生成 各 个 阶段 所 需 的 样本 试验 数 
据 。 为 了 简化 设计 ,我 们 假设 or = ocxwr > yc, 即 两 处 理 
组 有 共 方 差 。 在 模拟 比较 中 , 较 “ 客 观 ” 的 先 验 分 布 选择 
Enthusiastic 先 验 、Skeptical 先 验 、Handicap 先 验 和 
Non-informative 先 验 (无 信息 先 验 )。 Pocock 和 
O'Brien & Fleming 两 种 方法 的 参数 设 定 如 表 1。 

基于 经 典 期 中 分 析 结 果 , 提 出 了 评价 贝 叶 斯 期 中 分 
析 效 果 的 两 个 指标 , 即 贝 叶 斯 阳性 符合 率 和 贝 叶 斯 阴性 
符合 率 ””。 贝 叶 斯 阳性 符合 率 计算 公式 如 公式 (1): 
Ne 
人 

假设 在 有 差异 的 两 总 体 中 ,进行 了 Nm 次 成 组 序 贯 
模拟 ; NY :在 入, 试验 中 ,经 典 期 中 分 析 N7 次 拒绝 已 ; 
N2 在 N 试验 中 , 贝 叶 斯 期 中 分 析 Ne 次 拒绝 媚 ; N53: 
在 经 典 期 中 分 析 NY 次 拒绝 五, 的 试验 中 , 贝 叶 斯 期 中 
分 析 也 拒绝 豆 o 的 次 数 。 

从 公式 (1) ,我 们 可 推出 ,经 典 期 中 分 析 的 功效 
Powerc = Np /N, ; 贝 叶 斯 期 中 分 析 的 功效 
Powers = Np/N, 

贝 叶 斯 阴性 符合 率 计算 公式 如 公式 (2): 
Ne 
Ne 

假设 在 无 差异 的 两 总 体 中 ,进行 了 N 次 成 组 序 贯 
模拟 ; NA :在 N, 试验 中 ,经 典 期 中 分 析 N* 次 不 拒绝 
Ho ; NM2 :在 N 试验 中 , 贝 叶 斯 期 中 分 析 N2 次 不 拒绝 
Ho ; N :在 经 典 期 中 分 析 NL 次 不 拒绝 的 试验 中 ， 
贝 叶 斯 期 中 分 析 也 不 拒绝 五, 的 次 数 。 

从 公式 (2) ,我 们 可 推出 ,经 典 期 中 分 析 的 I 类 错误 
a=1 -NT/N ;按照 频率 学 派 观点 , 贝 叶 斯 期 中 分 析 的 

1 类 错误 e =1 -Ne/N 。 与 此 同时 ,我们 也 可 计算 另外 


C,= (1) 


(2) 


C,= 


* 1640: 


两 个 指标 , 即 贝 叶 斯 期 中 分 析 的 平均 样本 量 (Average 
Sample Size) 记 为 ASS, 和 平均 终止 阶段 数 (Average 
Stage), 记 为 AS,。 


表 1 参数 设 定 
Tab.1 Parameter setting 


Parameter Value( B=0.2) 

Q 0.05 0.05 
0r=0c=0 10 18 
0= 休 -pc(9) 2 3 
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2 结果 
2.1 两 总 体 均 数 相同 

在 两 总 体 均 数 相同 条 件 下 ,我 们 将 成 组 序 贯 设计 按 
以 下 参数 进行 设 定 ( 表 2)。 

在 O_Set5_1 和 O_Set5_2( 即 O'Brien & Fleming 
方法 ) 参 数 设置 下 ,不 同 先 验 分 布 和 贝 叶 斯 期 中 分 析 阴 
性 符合 率 以 及 工 类 错误 如 表 3。 在 P_Set5_1 和 P_Set5 
2( 即 Pocock 方 法 ) 参 数 设置 下 ,不 同 先 验 分 布 和 贝 叶 斯 
期 中 分 析 阴 性 符合 率 以 及 工 类 错误 如 表 4。 

由 以 上 结果 ,我 们 可 以 看 出 在 Enthusiastic 先 验 和 
Non-informative 先 验 的 条 件 下 , 贝 叶 斯 期 中 分 析 的 I 类 


表 2 O'Brien & Fleming 和 Pocock 方 法 参数 设 定 ( 两 总 体 均 数 相等 ) 
Tab.2 Parameter setting in the O'Brien & Fleming method and the Pocock method (two equal population means) 
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Condition 
Iteration B o Stage(K) Stopping HT Ac 0 
O_SetS_1 300 0.20 10 5 Reject 6 6 也 
O_SetS_2 300 0.20 18 5 Reject 6 6 3 
P_Set5_1 300 0.20 10 3 Reject 6 6 2 
PSets. 2 300 0.20 18 5 Reject 6 6 3 


表 3 O'Brien & Fleming 方 法 下 的 贝 叶 斯 阴性 符合 率 、I 类 错误 
Tab.3 Bayesian negative coincidence rate and Type I error in the 
O'Brien & Fleming method 


O_SetS_1 O_Set5 2 

Method 

CF) a/a(%) Ci%) a/s(%) 
Non-informative Prior 92.01 11.67 87.76 16.33 
Skeptical Prior 99.65 333 99.30 4.00 
Enthusiastic Prior $521 47.00 57.69 45.00 
Handicap Prior 99.65 3.00 99.30 3.33 
O'Brien & Fleming - 4.00 - 4.67 


表 4 Pocock 方 法 下 的 贝 叶 斯 阴性 符合 率 、[ 类 错误 
Tab.4 Bayesian negative coincidence rate and Type I error in 
the Pocock method 


P_Set5_1 P_Set5_2 
Method 
Ci(W) a/e(W) CW%) a/e(%) 
Non-informative Prior 93.15 9.33 89.31 13.67 
Skeptical Prior 99.32 2.67 98.62 3.00 
Enthusiastic Prior 61.99 39.67 57.93 44.00 
Handicap Prior 99.32 2.67 98.97 2.67 


Pocock - 2.67 - 3.33 


错误 均 明 显 大 于 0.05; 其 中 在 Non-informative 先 验 条 
件 下 ,5 阶段 在 0.10 以 上 。 在 Handicap 先 验 和 Skeptical 
先 验 条 件 下 , 工 类 错误 均 能 控制 在 0.05 左 右 。 当 总 阶 
段 数 调整 为 3 或 者 2 时 , 贝 叶 斯 期 中 分 析 阴 性 符合 率 和 


I 类 错误 与 5 阶段 条 件 下 的 结果 相似 。 

2.2 两 总 体 均 数 不 同 

在 两 总 体 均 数 不 同 条 件 下 ,我们 将 成 组 序 贯 设计 按 
以 下 参数 进行 设 定 ( 表 5)。 

在 O_Set5_D1、O_Set5_D2.P_Set5_D1 和 P_Set5 
D2 参数 设置 下 , 儿 种 第 见 先 验 分 布 的 贝 叶 斯 期 中 分 析 平 
均 阶 段 数 平均 样本 量 功效 和 阳性 符合 率 ( 表 6,7)。 

通过 以 上 5 阶段 的 结果 可 以 看 出 , 当 O'Brien & 
Fleming 功效 在 80% 左 右 时 ,基于 Handicap 先 验 和 
Skeptical 先 验 的 贝 叶 斯 功效 相对 较 低 ,而 基于 
Enthusiastic 先 验 和 Non-informative 先 验 的 贝 叶 斯 功 
效 明 显 较 高 。 此 外 , 几 种 先 验 分 布 的 贝 叶 斯 期 中 分 析 
所 需 的 平均 阶段 数 和 平均 样本 量 均 比 O'Brien & 
Fleming 方 法 要 低 ,而 基于 Handicap 先 验 和 Skeptical 
先 验 的 贝 叶 斯 期 中 分 析 均 能 提前 终止 试验 。 当 
Pocock 功效 在 80% 时 ,Skeptical 和 Handicap 两 种 先 验 
分 布 的 贝 叶 斯 功效 仍旧 明显 较 低 ,而 Enthusiastic 先 验 
和 Non-informative 先 验 的 贝 叶 斯 功效 均 比 Pocock 功 
效 要 高 。 与 此 同时 ,基于 Handicap 先 验 和 Skeptical 先 
验 的 贝 叶 斯 期 中 分 析 相 对 于 Pocock 方 法 而 言 并 不 能 
明显 的 提前 终止 试验 。 


3 讨论 
3.1 两 总 体 均 数 相同 情况 

从 实际 模拟 效果 来 看 ,在 O'Brien & Fleming 和 
Pocock 期 中 分 析 方 法 下 ,使 用 Enthusiastic 先 验 和 Non- 
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表 5 O'Brien & Fleming 和 了 Pocock 方 法 参数 设 定 (两 总 体 均 数 不 等 ) 
Tab.5 Parameter setting in the O' Brien & Fleming method and the Pocock method (two unequal population means) 
Condition 
Iteration pb o Stage(K) Stopping Hr Hc 6 
O_Set5_DI1 300 0.20 10 5 Reject 8 6 2 
O_Set5_D2 300 0.20 18 5 Reject 9 6 3 
P_Set5_D1 300 0.20 10 5 Reject 8 6 2 
P_Set5_D2 300 0.20 18 5 Reject 9 6 3 


表 6 O'Brien & Fleming 方 法 下 的 贝 叶 斯 平均 样本 量 、 平 均 阶段 数 、 阳 性 符合 率 和 功效 


Tab.6 Average sample size, average stage, Bayesian positive coincidence rate and power in the O’ Brien & Fleming method 


O_SetS_D1 O_Set5_D2 
Method 
ASS, AS, C,(%) Power (%) ASS, AS, Cn(90) Power (%) 

Non-informative Prior 352553 2.73 100.00 85.00 489.09 2.64 100.00 86.33 
Skeptical Prior 469.91 3.65 89.18 69.67 663.69 3.58 92.05 73.67 
Enthusiastic Prior 187.30 1.45 100.00 97.67 295.93 1:59 100.00 96.00 
Handicap Prior 474.19 3.68 87.88 68.00 666.16 3.59 89.54 71.67 
O'Brien & Fleming 498.21 3.87 77.00 703.74 3.79 - 79.67 


表 7 Pocock 方 法 下 的 贝 叶 斯 平均 样本 量 、 平 均 阶段 数 、 阳 性 符合 率 和 功效 


Tab.7 Average sample size, average stage, Bayesian positive coincidence rate and power in the Pocock method 


P_Set5_D1 P_Set5_D2 
Method 
ASS, AS, C,(%) Power (%) ASS, AS, C,(%) Power (%) 

Non-informative Prior 388.85 2:50 100.00 91.33 547.25 2.45 100.00 92.00 
Skeptical Prior 472.02 3.04 78.15 66.33 672.29 3.01 77.96 66.67 
Enthusiastic Prior 227.95 1.46 100.00 97.67 297.02 1.33 100.00 99.33 
Handicap Prior 473.05 3.04 3 65.33 675.28 3.02 75.92 64.33 
Pocock 478.21 3.08 79.33 681.25 3.05 - 81.67 


informative 先 验 进 行 贝 叶 斯 期 中 分 析 会 增加 I 类 错误 的 
风险 , 而 Handicap 先 验 和 Skeptical 先 验 均 可 较 好 的 控 
制 1 类 错误 ,因此 这 两 种 先 验 是 比较 合适 的 先 验 选择 。 
Skeptical 先 验 .Handicap 先 验 和 Non-informative 先 验 
均 比 Enthusiastic 先 验 显著 的 增加 贝 叶 斯 阴性 符合 率 ， 
这 意味 着 在 原 假设 成 立 的 条 件 下 , 基于 Enthusiastic 先 
验 的 贝 叶 斯 期 中 分 析 结 果 很 可 能 会 和 其 他 3 种 先 验 所 
得 的 结论 不 一 致 。 这 种 现象 提示 我 们 ,在 保证 试验 因素 
能 够 继续 进行 研究 的 前 提 下 ,如果 贝 叶 斯 期 中 分 析 在 
Non-informative 先 验 和 Enthusiastic 先 验 之 间 出 现 不 一 
致 的 结论 , 则 该 研究 可 能 是 一 个 阴性 研究 中 。 我 们 还 发 
现 基 于 Handicap 先 验 和 Skeptical 先 验 的 贝 叶 斯 阴性 符 
合 率 均 接近 100% ,从 先 验 分 布 选择 的 角度 来 说 ， 
Skeptical 先 验 是 在 阳性 研究 (Positive study) 中 建议 使 
用 的 分 布 ,这 意味 着 其 更 倾向 于 “保守 ”, 而 Handicap 先 
验 的 贝 叶 斯 阴性 符合 率 和 工 类 错误 均 与 Skeptical 先 验 


相近 ,因此 可 认为 这 两 种 先 验 的 “保守 ”程度 是 比较 接近 
的 。 此 外 ,在 大 样本 的 条 件 下 ,不 同 先 验 分 布 的 后 验 概 
率 分 布 之 间 通 常 上 只 有 很 微小 的 差异 ,因此 大 样本 条 件 下 
基于 各 种 先 验 的 贝 叶 斯 期 中 分 析 就 等 同 于 敏感 度 分 析 ， 
其 目的 是 评估 试验 数据 支持 结论 的 强度 。 
3.2 两 总 体 均 数 不 同情 况 
从 5 阶段 成 组 序 贯 设计 所 得 的 各 种 先 验 分 布 的 功 
效 结 果 来 看 , 当 O'Brien && Fleming 和 Pocock 功效 在 
80% 时 ,基于 Handicap 先 验 和 Skeptical 先 验 的 贝 叶 斯 
期 中 分 析 的 功效 相 比 较 而 言明 显 偏 低 ; 当 OBrien & 
Fleming 功效 逐渐 增 大 时 ,以 上 两 种 先 验 分 布 的 贝 叶 斯 
功效 开始 接近 O'Brien & Fleming 方 法 的 功效 。 这 是 因 
为 在 参数 相同 条 件 下 ,如果 先 验方 差 较 小 , 则 基于 该 先 
验 分 布 的 贝 叶 斯 期 中 分 析 更 易 得 到 较 大 的 P 值 ,这 也 意 
味 着 基于 该 先 验 的 贝 叶 斯 期 中 分 析 更 加 的 保守 ,其 功效 
也 会 相应 的 较 低 ;如 果 两 种 先 验方 差 的 比值 逐渐 增 大 ， 


201712.00720v1 


chinaXiv 


"了 642 ， 


两 者 功效 之 间 的 差异 则 会 逐渐 增 大 。 然 而 随 着 
O'Brien & Fleming 功效 的 逐渐 提高 ,基于 以 上 两 种 先 
验 的 贝 叶 斯 功效 也 会 逐渐 接近 OBrien & Fleming 的 功 
效 。 这 点 也 充分 说 明 ,在 大 样本 条 件 下 ,不 同 先 验 分 布 
下 的 后 验 概率 分 布 之 间 通 常 只 有 微小 的 差异 。 此 外 ,在 
O'Brien & Fleming 和 Pocock 的 功效 较 低 的 条 件 下 , 基 
于 Handicap 先 验 和 Skeptical 先 验 的 贝 叶 斯 阳性 符合 率 
均 较 低 ,这 就 意味 着 一 方面 基于 这 两 种 先 验 的 贝 叶 斯 期 
中 分 析 的 功效 相对 于 Pocock 和 O'Brien & Fleming 功 
效 而 言 均 较 低 ; 另 一 方面 从 频率 学 派 角度 来 说 ,基于 这 
两 种 先 验 的 分 析 结 果 的 可 靠 性 也 较 低 。 值 得 一 提 的 是 ， 
当 O'Brien && Fleming 功效 在 80 多 的 时 候 ,基于 
Skeptical 先 验 和 Non-informative 先 验 的 贝 叶 斯 阳性 符 
合 率 之 间 有 较 大 差异 。 这 种 差异 对 于 阳性 研究 来 说 不 
但 意味 着 需要 进行 证 实 性 的 试验 研究 ,而 且 也 可 能 提示 
着 试验 因素 可 能 没有 被 完全 理解 "”。 

对 于 O'Brien & Fleming 方 法 来 说 ,早期 是 很 难 拒 
绝 零 假 设 的 ,这 也 使 得 贝 叶 斯 期 中 分 析 能 提前 终止 试验 
的 特点 显得 非常 突出 。 然 而 在 亚 期 临床 试验 中 ,为 了 对 
药物 作 有 效 性 评价 ,成 组 序 贯 设计 又 通常 会 选择 应 用 
O'Brien & Fleming 方 法 3, 因此 在 验证 有 效 性 的 临床 
试验 中 , 当 O'Brien & Fleming 方 法 的 功效 越 高 ,基于 
Handicap 先 验 和 Skeptical 先 验 的 贝 叶 斯 期 中 分 析 的 功 
效 就 会 越 接 近 O'Brien & Fleming 方 法 的 功效 ,在 功效 
较 高 且 相 近 的 条 件 下 ,基于 Handicap 先 验 和 Skeptical 
先 验 的 贝 叶 斯 期 中 分 析 均 能 增加 试验 提前 结束 的 可 能 
性 。 另 外 ,基于 Handicap 先 验 和 Skeptical 先 验 的 贝 叶 
斯 期 中 分 析 方 法 相对 于 Pocock 方 法 而 言 并 不 能 明显 提 
前 终止 试验 。 这 是 因为 5 阶段 Pocock 法 允许 试验 早期 
以 较 小 的 临界 值 (相当 于 早期 设置 了 较 大 的 名 义 检 验 水 
平 , 即 名 义 w = 0.0169) 来 拒绝 零 假 设 ,这 也 就 意味 着 一 些 
试验 可 能 在 早期 (甚至 在 第 1 阶段 ) 因 为 拒绝 零 假 设 而 终 
止 , 正 因为 Pocock 具 有 较 早 的 拒绝 瓦 o 的 特点 ,所 以 在 提 
前 终止 试验 方面 贝 叶 斯 期 中 分 析 相对 于 Pocock 法 而 言 
并 没有 什么 优势 。 

综 上 所 述 , 当 采 用 功效 达到 80% 以 上 且 早 期 不 易 拒 
绝 零 假 设 的 传统 成 组 序 贯 设 计时 ,基于 Skeptical 先 验 和 
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Handicap 先 验 的 贝 叶 斯 期 中 分 析 既 能 使 结果 具有 较 强 
的 可 靠 性 ,又 能 显著 增加 试验 提前 终止 的 可 能 
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